NVIDIA GB300多项设计规格将有提升,估3Q25后整柜系统将逐步扩大出货规模
根据TrendForce最新AI server供应链调查,预期NVIDIA将提早于2025年第二季推出GB300晶片,但就整柜式server系统来看,其计算性能、记忆体容量、网路连接和电源管理等性能皆较GB200提升,因此,ODM等供应商需要更多时间进行测试与执行客户验证。观察供应链近期动态,GB300相关供应商将于今年第二季陆续规划设计作业,其中,估GB300晶片及Compute Tray(运算匣)等将于5月开始生产,ODM厂进行初期ES(engineering sample)阶段样机设计;预期第三季待机柜系统、电源规格设计、SOCAMM等陆续定案及量产后,GB300系统可望逐步扩大出货规模。
分析NVIDIA今年出货情况,HOPPER平台目前仍是出货大宗,新平台Blackwell则于第一季起逐步扩大放量,预计至第三季整柜系统出货量将以GB200为主。此外,得益于DeepSeek效应,近期中国市场对于特规版产品H20需求明显提升。
接续的GB300有多项规格更新,其中,为搭配机柜系统,GB300 NVL72的网通设计规格升级,以满足更高频宽需求,提升整体运算效能。而BBU(battery backup unit)虽然并非为GB300的标配,但随著server机柜功耗持续增加,预期客户将扩大采用BBU配置。
在TDP(热设计功耗)部分,2024年NVIDIA主流机种为HGX AI server,TDP落在60KW与80KW间,目前主推的GB200 NVL72机柜因运算密度大幅提升,每柜TDP达125KW至130KW。TrendForce预估,GB300机柜系统功耗将再提升至135KW与140KW间,多数业者将持续采用Liquid-to-Air的散热方式,确保散热效果。
至于散热零组件设计,目前GB200的Cold Plate(水冷板)是搭配一颗CPU和两颗GPU的整合模组型态,到GB300将由整合模组改为各晶片独立搭载Cold Plate,将提高Cold Plate在Compute Tray的价值。而QD(水冷快接头)部分,由于Cold Plate模组改为各自独立,将大量增加QD用量。而GB200的QD供应商以欧美业者为主,预期至GB300后将有更多台厂加入供应行列。
TrendForce指出,预期今年GB200和GB300 Rack方案放量情形将受几项因素影响;首先,DeepSeek效应余波荡漾,AI server主要客户CSP将更重视AI投入成本与效益,可能转向自研ASIC或设计相对简易、成本较低的AI server方案。此外,GB200和GB300 Rack供应链能否如期完成整备也存在变数,后续实际供应进度和客户需求变化仍待观察。